扫描下载APP
其它方式登录
美光高管指出AI推理对内存需求呈爆炸式增长,核心瓶颈在于KV缓存所需的海量、高速内存;HBM4与245TB SSD是关键突破方向;全球五座晶圆厂同步建设仍难跟上需求,内存已成为支撑AI推理与训练的战略性基础设施。
苹果团队提出“简单自蒸馏”(SSD)方法,通过高温采样与截断从大模型自身生成数据并直接用于监督微调,无需强化学习、教师模型或代码执行验证,在Qwen和Llama系列多个模型上显著提升代码生成能力,尤其在高难度任务中pass@1提升达30.4%,核心机制是重塑模型token概率分布以兼顾精度与探索。